SelfJudge: Decodificación especulativa más rápida mediante verificación de juez autosupervisada
SelfJudge acelera la decodificación especulativa mediante verificación autosupervisada, logrando inferencia más rápida en modelos de lenguaje sin sacrificar precisión.